AI 原理與協定 — Mitpy's Blog

AI 原理與協定 6 篇文章

2026年6月9日

不同專家處理，怎麼還拼得出通順的句子？拆解 MoE 的真正運作

MoE 把一句話分給不同專家處理，那拼回來怎麼還會通順？這其實是個誤會——根本沒有「拼句子」這一步。本文用最白話的方式講清楚 MoE 怎麼把字一個一個吐出來，順帶戳破「MoE 一定比較快」這個被簡化過頭的說法。

2026年6月8日

ReAct：讓語言模型邊想邊做，而不是閉著眼睛猜

為什麼語言模型會自信地編出一個錯答案？因為它只會「想」，碰不到外面的世界。ReAct（Reason + Act）把推理和行動交織成一個迴圈：想一步、做一步、看一步。本文用一段實際的 trace 和一個最小可跑的 Python 迴圈，講清楚 ReAct 的原理，以及它和今天 AI agent 的關係。

#ReAct#AI Agent#LLM#Reasoning#Tool Use#Chain-of-Thought

2026年6月6日

Temperature、Top-K、Top-P：三個參數，其實在管同一件事

同樣的提問，為什麼模型每次回答都不一樣？因為它不是在「想答案」，而是在抽籤。Temperature、Top-K、Top-P 這三個參數，控制的就是這場抽籤怎麼抽——本文用一個具體例子把它們講清楚。

#LLM#Sampling#生成式 AI

2026年6月4日

Dense、MoE、Hybrid：Transformer 的 FFN 有三種長法

DeepSeek-V3 寫著 671B 總參數、只啟動 37B；Snowflake Arctic 是 480B 總量、17B active。同樣叫 Transformer，差在哪？答案不在注意力，而在每一層的 FFN——本文拆解 Dense、MoE、與兩種 Hybrid 的結構差異。

#LLM#Transformer#MoE#模型架構

2026年6月3日

Harmony vs ChatML：兩代對話協定差在哪

很多人預設開源模型都吃 ChatML，但 OpenAI 為推理設計的 Harmony 是另一套協定。本文拆解兩者的世代差異——多 channel、角色階層、控制 token——以及為什麼你用 OpenAI-compatible API 呼叫時根本碰不到這層。

#LLM#Harmony#ChatML#API

2026年5月8日

探索 MCP 協定：Server、Client、Transport 與身份驗證的設計邏輯

在設定裡加幾行 JSON，AI 就能讀你的資料庫——這背後是 MCP 協定。本文拆解 Host/Client/Server 架構、stdio 與 Streamable HTTP 兩種 Transport，以及 OAuth 2.1 身份驗證的完整流程。

#MCP#AI#協定#OAuth#架構